Prediction of protein structure classes and secondary structures by means of hidden Markov models

Author(s):  
Hiroshi Yoshikawa ◽  
Mitsunori Ikeguchi ◽  
Shugo Nakamura ◽  
Kentaro Shimizu ◽  
Junta Doi
2009 ◽  
Vol 25 (10) ◽  
pp. 1264-1270 ◽  
Author(s):  
Patrik Björkholm ◽  
Pawel Daniluk ◽  
Andriy Kryshtafovych ◽  
Krzysztof Fidelis ◽  
Robin Andersson ◽  
...  

2010 ◽  
Vol 4 (2) ◽  
pp. 916-942 ◽  
Author(s):  
Kristin P. Lennox ◽  
David B. Dahl ◽  
Marina Vannucci ◽  
Ryan Day ◽  
Jerry W. Tsai

Author(s):  
Kevin Karplus ◽  
Kimmen Sjölander ◽  
Christian Barrett ◽  
Melissa Cline ◽  
David Haussler ◽  
...  

2021 ◽  
Author(s):  
Άχμεντ Ρούμια

Υπολογιστικές μελέτες πρόγνωσης δομής και λειτουργίας πρωτεϊνών. Οι μεμβρανικές πρωτεΐνες συναντώνται ευρέως σε όλα τα ζωντανά κύτταρα όπου διαδραματίζουν καθοριστικό ρόλο στα μεταβολικά μονοπάτια (Cymer et al., 2015). Με βάση την φύση των αλληλεπιδράσεων μεμβράνης-πρωτεΐνης, μπορούμε να κατατάξουμε τις μεμβρανικές πρωτεΐνες σε δύο μεγάλες κατηγορίες: τις διαμεμβρανικές και τις περιφερειακές. Οι διαμεμβρανικές πρωτεΐνες (IMPs) παίζουν ζωτικό ρόλο στις κυτταρικές διεργασίες και στην κυτταρική επικοινωνία. Αντιπροσωπεύουν περίπου το 20-30% του ανθρώπινου γονιδιώματος. Μπορούν να χωριστούν με βάση τα δομικά χαρακτηριστικά τους σε δύο διακριτές κατηγορίες: τις α-ελικοειδείς διαμεμβρανικές πρωτεΐνες και τα β-βαρέλια (von Heijne, 1999).Τα διαμεμβρανικά β-βαρέλια της εξωτερικής μεμβράνης (βΟΜΡ) είναι σημαντικά συστατικά των εξωτερικών μεμβρανών των χλωροπλαστών, των μιτοχονδρίων και των αρνητικών κατά Gram βακτηρίων (Schulz, 2002). Παίζουν κεντρικό ρόλο στη σηματοδότηση και τη βιογένεση μεμβρανών και πραγματοποιούν μια σειρά σημαντικών κυτταρικών λειτουργιών συμπεριλαμβανομένης της δράσης ως μεταφορέων, πορινών, ενζύμων, παραγόντων μολυσματικότητας και υποδοχέων (Furer et al., 2011). Επιπλέον, τα διαμεμβρανικά β-βαρέλια παίζουν καθοριστικό ρόλο στη σύνδεση των οργανιδίων διπλής μεμβράνης με το υπόλοιπο κύτταρο. Συγκεκριμένα, τα κανάλια διευθετούν την μεταφορά προς το οργανίδιο προ-πρωτεϊνών του που συντίθενται στο κυταρόπλασμα και επιτρέπουν τη ροή πολυάριθμων μεταβολιτών (Hagan et al., 2011; Jores et al., 2016; Paschen et al., 2003; Voulhoux) et al., 2003; Wiedemann et al., 2003; Wu et al., 2005). Η παρουσία β-βαρελιών σε αυτά τα οργανίδια υποστηρίζει περαιτέρω την υπόθεση ότι οι χλωροπλάστες και τα μιτοχόνδρια εξελίχθηκαν από προκαρυωτικούς προγόνους όπως προτείνει η ενδοσυμβιωτική θεωρία (Dolezal et al., 2006). Τα διαμεμβρανικά β-βαρέλια σχηματίζουν επίσης μια αμυντική γραμμή για τα Gram-αρνητικά βακτήρια κατά της εισβολής παθογόνων και των επακόλουθων μολύνσεων, ενώ εκτελούν πολλές σημαντικές λειτουργίες εντός του κυττάρου, όπως η κυτταρική σηματοδότηση, η κυτταρική προσκόληση και η εισαγωγή θρεπτικών συστατικών (Noinaj et al., 2015). Η μεταφορά στα μιτοχόνδρια των πρωτεϊνών που κωδικοποιούνται στον πυρήνα πραγματοποιείται από διακριτές πρωτεϊνικές «μηχανές» μεταφοράς αποτελούμενες από πολλές υπομονάδες, οι οποίες εντοπίζονται στις εξωτερικές και εσωτερικές μεμβράνες των μιτοχονδρίων. Η πύλη εισόδου των μιτοχονδρίων για αυτές τις προ-πρωτεΐνες σχηματίζεται από την τρανσλοκάση της εξωτερικής μεμβράνης του μιτοχονδρίου (TOM). Μέσω του συμπλέγματος TOM, τα πρόδρομα β-βαρέλια μεταφέρονται σε ένα άλλο σύμπλοκο στην εξωτερική μεμβράνη, το σύμπλοκο TOB (Topogenesis of mitochondrial outer membrane β-barrel proteins) ή το σύμπλοκο SAM (Sorting and Assembly Machinery). Το τελευταίο σύμπλοκο μεσολαβεί στην εισαγωγή των προδρόμων β-βαρελιών στην εξωτερική μεμβράνη (Kozjak et al., 2003; Paschen et al., 2003; Wiedemann et al., 2003). Ο λόγος για τον οποίο αυτά τα μιτοχονδριακά β-βαρέλια καταλήγουν αποκλειστικά στο μιτοχόνδριο είναι ακόμα ασαφής. Πρόσφατα, ένα χαρακτηριστικό μοτίβο, η β-φουρκέτα, αποτελούμενο από εξαιρετικά υδρόφοβα αμινοξικά κατάλοιπα, ανακαλύφθηκε και, κατά συνέπεια, αυτό είναι πιθανώς το μιτοχονδριακό σήμα στόχευσης για τα διαμεμβρανικά β-βαρέλια (Jores et al., 2016). O βασικός σκοπός αυτής της εργασίας είναι η περιεκτική υπολογιστική μελέτη των χαρακτηριστικών σε επίπεδο αμινοξικής ακολουθίας όλων των βOMPs με στόχο την αποκάλυψη βασικών χαρακτηριστικών που οδηγούν στον λειτουργικό χαρακτηρισμό και την ταξινόμησή τους. Η παρούσα εργασία επικεντρώνεται κυρίως στους ακόλουθους τρεις στόχους: Ο πρώτος μας στόχος είναι να χαρακτηρίσουμε πλήρως τις οικογένειες των μιτοχονδριακών και χλωροπλαστικών βΟΜΡ, που είναι ήδη γνωστές στη βιβλιογραφία (δηλαδή, υπάρχουν πειραματικά δεδομένα για τον εντοπισμό και τη λειτουργία των πρωτεϊνών), αλλά δεν έχουν μέχρι σήμερα μελετηθεί και χαρακτηριστεί με υπολογιστικές μεθόδους. Η βάση δεδομένων PFAM (El-Gebali et al., 2019), η πληρέστερη βάση δεδομένων οικογενειών πρωτεϊνών, περιλαμβάνει μόνο λίγες χαρακτηριστικά προφίλ για αυτές τις οικογένειες. Για το σκοπό αυτό, εμείς: 1. Πραγματοποιήσαμε μια ολοκληρωμένη αναζήτηση της βιβλιογραφίας για όλα τα ευκαρυωτικά διαμεμβρανικά βΟΜΡ. 2. Πραγματοποιήσαμε μια υπολογιστική ανάλυση όλων των ευκαρυωτικών διαμεμβρανικών βΟΜΡ και μελετήσαμε τα χαρακτηριστικά των αμινοξικών ακολουθιών τους. 3. Χωρίσαμε την οικογένεια ευκαρυωτικών πορινών (PFAM: PF01459) σε δύο διαφορετικές οικογένειες βOMP: τα εξαρτώμενα από την τάση κανάλια ανιόντων (VDAC) και τις τρανσλοκάσες της εξωτερικής μεμβράνης του μιτοχονδρίου 40 (TOM40). Παρόλο που αυτές οι δύο οικογένειες παρουσιάζουν υψηλή ποικιλομορφία σε επίπεδο αμινοξικής ακολουθίας (Cavalier-Smith, 2006; Maćašev et al., 2004; Paschen et al., 2003), κατατάσσονται στην ίδια οικογένεια στην PFAM (El-Gebali et al., 2019). 4. Μελετήσαμε τη συχνότητα εμφάνισης όλων των ευκαρυωτικών διαμεμβρανικών οικογενειών βΟΜΡ στα πρωτεώματα ευκαρυωτικών οργανισμών-μοντέλων και αποδόσαμε νέο λειτουργικό σχολιασμό για πολλές προηγουμένως μη χαρακτηρισμένες πρωτεΐνες. Ο δεύτερος στόχος μας είναι η OMPdb (Tsirigos et al., 2011), μια βάση δεδομένων για βακτηριακά βΟΜΡ, να γίνει ένας ενιαίος κόμβος για όλα τα διαμεμβρανικά βΟΜΡ, ευκαρυωτικά και προκαρυωτικά. Από το 2011, η OMPdb λειτούργησε ως αποθετήριο για τα βακτηριακά βΟΜΡ και είναι μέχρι τώρα η πιο πλήρης συλλογή διαμεμβρανικών βΟΜΡ των αρνητικών κατά Gram βακτηρίων. Ενημερώνεται διαρκώς χρησιμοποιώντας μια συλλογή χαρακτηριστικών προφίλ Hidden Markov Models (pHMMs) (Tsirigos et al., 2011). Εδώ κάναμε τα εξής: 1. Προσθέσαμε νέες οικογένειες και ενημερώσαμε τις υπάρχουσες είτε συμπεριλαμβάνοντας νέο λειτουργικό σχολιασμό ή ενημερώνοντας τα αντίστοιχα pHMMs. 2. Συμπεριλάβαμε νέες δυνατότητες, όπως η δημιουργία τρισδιάστατων μοντέλων για όλα τα μέλη του αρχικού συνόλου (seed set) κάθε οικογένειας, η πλήρης τοπολογία κάθε πρωτεΐνης χρησιμοποιώντας τους αλγόριθμους πρόγνωσης SignalP5 και PREDTMBB2 και, τέλος, ο επανασχεδιασμός του περιβάλλοντος εργασίας χρήστη (user interface). Ο τρίτος στόχος μας είναι να μελετήσουμε τα χαρακτηριστικά των δύο τελευταίων β-φύλλων των μιτοχονδριακών βΟΜΡs και να δοκιμάσουμε για να κατασκευάσουμε μια υπολογιστική μέθοδο βασισμένη σε κρυφά μοντέλα Markov για την αναγνώριση όλων των μιτοχονδριακών διαμεμβρανικών βΟΜΡ. Για να διερευνήσουμε αυτά τα χαρακτηριστικά, ακολουθήσαμε τα εξής βήματα: 1. Προσπαθήσαμε να δημιουργήσουμε ένα ειδικό pHMM με βάση τα τελευταία δύο β-φύλλα των μιτοχονδριακών βΟΜΡs. 2. Πραγματοποιήσαμε πολλαπλές αναζητήσεις χρησιμοποιώντας αυτό το pHMM σε θετικά και αρνητικά σύνολα ώστε να αξιολογήσουμε την ικανότητά του να ανιχνεύει όλα τα μιτοχονδριακά βΟΜΡ και να τα ξεχωρίζει από τα αντίστοιχα σφαιρικά-υδατοδιαλυτά, χλωροπλαστικά ή/και βακτηριακά β-βαρέλια.


Viruses ◽  
2019 ◽  
Vol 11 (4) ◽  
pp. 320 ◽  
Author(s):  
Heleri Kirsip ◽  
Aare Abroi

It has been believed for a long time that the transfer and fixation of genetic material from RNA viruses to eukaryote genomes is very unlikely. However, during the last decade, there have been several cases in which “virus-to-host” gene transfer from various viral families into various eukaryotic phyla have been described. These transfers have been identified by sequence similarity, which may disappear very quickly, especially in the case of RNA viruses. However, compared to sequences, protein structure is known to be more conserved. Applying protein structure-guided protein domain-specific Hidden Markov Models, we detected homologues of the Virgaviridae capsid protein in Schizophora flies. Further data analysis supported “virus-to-host” transfer into Schizophora ancestors as a single transfer event. This transfer was not identifiable by BLAST or by other methods we applied. Our data show that structure-guided Hidden Markov Models should be used to detect ancestral virus-to-host transfers.


2015 ◽  
Vol 135 (12) ◽  
pp. 1517-1523 ◽  
Author(s):  
Yicheng Jin ◽  
Takuto Sakuma ◽  
Shohei Kato ◽  
Tsutomu Kunitachi

Author(s):  
M. Vidyasagar

This book explores important aspects of Markov and hidden Markov processes and the applications of these ideas to various problems in computational biology. It starts from first principles, so that no previous knowledge of probability is necessary. However, the work is rigorous and mathematical, making it useful to engineers and mathematicians, even those not interested in biological applications. A range of exercises is provided, including drills to familiarize the reader with concepts and more advanced problems that require deep thinking about the theory. Biological applications are taken from post-genomic biology, especially genomics and proteomics. The topics examined include standard material such as the Perron–Frobenius theorem, transient and recurrent states, hitting probabilities and hitting times, maximum likelihood estimation, the Viterbi algorithm, and the Baum–Welch algorithm. The book contains discussions of extremely useful topics not usually seen at the basic level, such as ergodicity of Markov processes, Markov Chain Monte Carlo (MCMC), information theory, and large deviation theory for both i.i.d and Markov processes. It also presents state-of-the-art realization theory for hidden Markov models. Among biological applications, it offers an in-depth look at the BLAST (Basic Local Alignment Search Technique) algorithm, including a comprehensive explanation of the underlying theory. Other applications such as profile hidden Markov models are also explored.


Sign in / Sign up

Export Citation Format

Share Document